জেসুপ (JSoup) CSS Selectors ব্যবহার করে HTML ডকুমেন্টের বিভিন্ন উপাদান নির্বাচন করতে সাহায্য করে। CSS Selectors হল স্টাইল শিটগুলিতে ব্যবহৃত নিয়ম, যা HTML ডকুমেন্টের নির্দিষ্ট ট্যাগ, ক্লাস, আইডি এবং অন্যান্য অ্যাট্রিবিউটগুলি নির্বাচন করতে ব্যবহৃত হয়। জেসুপ এর মাধ্যমে CSS Selectors ব্যবহার করে ডকুমেন্টের যে কোনো উপাদান (Elements) সহজে নির্বাচন করা যায়।
CSS Selectors ব্যবহার করার পদ্ধতি
একটি নির্দিষ্ট ট্যাগ নির্বাচন করা
আপনি যদি HTML ডকুমেন্টের কোনো নির্দিষ্ট ট্যাগ নির্বাচন করতে চান, তাহলে CSS Selector ব্যবহার করে select() মেথডটি ব্যবহার করা যায়। নিচে একটি উদাহরণ দেখানো হল যেখানে একটি <h1> ট্যাগ নির্বাচন করা হয়েছে:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupCssSelectorExample {
public static void main(String[] args) throws Exception {
String html = "<html><head><title>Example</title></head><body><h1>Welcome to JSoup</h1></body></html>";
// HTML পার্সিং
Document doc = Jsoup.parse(html);
// <h1> ট্যাগ নির্বাচন করা
Element h1 = doc.select("h1").first();
// নির্বাচিত <h1> ট্যাগের টেক্সট প্রিন্ট করা
System.out.println("Heading: " + h1.text());
}
}
এখানে select("h1") CSS Selector ব্যবহার করে <h1> ট্যাগটি নির্বাচন করা হয়েছে।
ক্লাস দ্বারা উপাদান নির্বাচন করা
CSS Selectors ব্যবহার করে আপনি HTML ডকুমেন্টের কোনো নির্দিষ্ট ক্লাসের সাথে সম্পর্কিত উপাদানগুলোও নির্বাচন করতে পারেন। উদাহরণস্বরূপ, যদি একটি ট্যাগের ক্লাস intro হয়, তাহলে CSS Selector দিয়ে এটি নির্বাচন করা সম্ভব:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupCssSelectorExample {
public static void main(String[] args) throws Exception {
String html = "<html><head><title>Example</title></head><body><p class='intro'>This is an introduction.</p></body></html>";
// HTML পার্সিং
Document doc = Jsoup.parse(html);
// .intro ক্লাস দ্বারা প্যারাগ্রাফ নির্বাচন করা
Element paragraph = doc.select(".intro").first();
// নির্বাচিত প্যারাগ্রাফের টেক্সট প্রিন্ট করা
System.out.println("Paragraph: " + paragraph.text());
}
}
এখানে .intro CSS Selector ব্যবহার করে ক্লাস intro এর সাথে সম্পর্কিত <p> ট্যাগটি নির্বাচন করা হয়েছে।
আইডি দ্বারা উপাদান নির্বাচন করা
আপনি যদি একটি নির্দিষ্ট আইডি দিয়ে HTML উপাদান নির্বাচন করতে চান, তাহলে CSS Selector দিয়ে # চিহ্ন ব্যবহার করা হয়। উদাহরণস্বরূপ:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupCssSelectorExample {
public static void main(String[] args) throws Exception {
String html = "<html><head><title>Example</title></head><body><div id='main'>This is the main content.</div></body></html>";
// HTML পার্সিং
Document doc = Jsoup.parse(html);
// #main আইডি দ্বারা ডিভ নির্বাচন করা
Element div = doc.select("#main").first();
// নির্বাচিত ডিভের টেক্সট প্রিন্ট করা
System.out.println("Div Content: " + div.text());
}
}
এখানে #main CSS Selector ব্যবহার করে আইডি main এর সাথে সম্পর্কিত <div> ট্যাগটি নির্বাচন করা হয়েছে।
আরও CSS Selectors
আপনি আরও নানা CSS Selector ব্যবহার করে HTML উপাদান নির্বাচন করতে পারেন, যেমন:
div > p:divট্যাগের ভিতরেরpট্যাগ নির্বাচন করাa[href]: যেসব<a>ট্যাগেরhrefঅ্যাট্রিবিউট রয়েছে, সেগুলো নির্বাচন করাp:nth-of-type(2):pট্যাগের দ্বিতীয় উপাদান নির্বাচন করা
সারাংশ
জেসুপ (JSoup) ব্যবহার করে CSS Selectors দিয়ে HTML ডকুমেন্ট থেকে বিভিন্ন উপাদান নির্বাচন করা খুবই সহজ। আপনি CSS Selector ব্যবহার করে ট্যাগ, ক্লাস, আইডি এবং অন্যান্য নির্বাচক দিয়ে উপাদানগুলি নির্বাচন করতে পারেন। এটি HTML ডকুমেন্টের মধ্য থেকে নির্দিষ্ট তথ্য এক্সট্র্যাক্ট করতে সাহায্য করে এবং ওয়েব স্ক্র্যাপিং বা ডেটা প্রক্রিয়াকরণের জন্য খুবই কার্যকরী।
Read more